ترجمه هوشمند اسامی فارسی در بازیابی اطلاعات بین زبانی

پایان نامه
چکیده

با گسترش روزافزون استفاده از اینترنت، کاربران و جستجوگران اطلاعات، دیگر تنها به منابع اطلاعاتی که به زبان آنها نوشته شده اکتفا نمی کنند. بنابراین سیستم های بازیابی اطلاعات بین زبانی، این نیاز را برای کاربران برآورده می سازند. به این صورت که می توان تنها با دادن پرس وجو در یک زبان، اسناد با زبان های مختلف را بازیابی کرد. از بین پرس وجوهای کاربران، اسامی افراد از اهمیت خاصی برخوردار هستند. زیرا تعداد زیادی از پرس وجوها به اسامی افراد اختصاص می یابد. همچنین کاربران زیادی صفحات شخصی خود را به زبان های دیگر طراحی می کنند. بنابراین در صورت تشخیص این اسامی در پرس وجوها و تبدیل آنها به زبان های دیگر (که نویسه گردانی نام دارد)، می توان به صفحات شخصی آنها مستقل از زبانی که هستند، دست یافت. در این پایان نامه، مروری کوتاه بر الگوریتم های تشخیص نام، سیستم های بازیابی اطلاعات بین زبانی و نیز به طور خاص نویسه گردانی کلمات انجام شده است. همچنین چالش های مطرح شده در این زمینه و روش عملکرد و نقاط قوت و ضعف آنها مورد بررسی قرار گرفته اند. در ادامه روشی برای تشخیص اسامی افراد به زبان فارسی با استفاده از موتور جستجو و همچنین روشی نوین به منظور نویسه گردانی این اسامی با استفاده از محتوای صفحات وب فارسی پیشنهاد شده است. مطابق آزمایشات انجام شده با استفاده از روش های پیشنهادی، می توان به دقت بالایی در زمینه تشخیص و ترجمه اسامی خاص و یا به عبارتی بازیابی اطلاعات بین زبانی اسامی افراد دست پیدا کرد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی- انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان

در این پژوهش میزان تأثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخ...

متن کامل

بررسی تأثیرات ریشه‌یابی در بازیابی اطلاعات در زبان فارسی

Using the language-specific behavior in information retrieval systems can improve the quality of the retrieved results significantly. Part of the word that remains after removing its affixes is called stem. Stemming process can be used for improving the relevancy of the results in information retrieval system. Different morphological variants of words (plural, past tense…) will be mapped into t...

متن کامل

سنجش میزان تکرار اطلاعات در بازیابی اطلاعات فارسی از وب با مقایسۀ موتورهای کاوش عمومی

هدف: پژوهش حاضر با هدف سنجش میزان تکرار اطلاعات بازیابی‌شدۀ فارسی در وب و مقایسۀ موتورهای کاوش از لحاظ میزان توانمندی در بازیابی کمترین تکرار در محتوای نتایج انجام گرفت.    روش: این پژوهش، از دستۀ مطالعات توصیفی است که از روش‌های کمّی و آمار توصیفی بهره می‌گیرد و با توجه به مقایسه و ارزیابی موتورهای کاوش، در زمرۀ تحقیقات ارزیابی نظام‌های بازیابی اطلاعات نیز محسوب می‌شود.     یافته‌ها: یافته‌ها...

متن کامل

تحلیلی بین زبانی از پارامتر ضمیراندازی در زبان فارسی

پارامتر ضمیر اندازی را می‌توان همان "محدودیت نیاز به فاعل" در نظر گرفت که در اولین مطالعات زایشی در این زمینه توسط پرمیوتر (1971) مطرح شد (جگلی و سفیر 1991) . براساس این پارامتر زبان‌های فاعل تهی (null subject) یا ضمیر انداز (pro-drop) در جملات زمان‌دار می‌توانند دارای فاعل‌های ناملفوظ باشند و در مقابل زبان‌های غیر ضمیرانداز الزاماً ضمیر فاعلی با نمود آوایی دارند. به موجب این پارامتر، زبان‌های د...

متن کامل

رتبه بندی کیفی موتورهای کاوش فارسی و غیر فارسی در بازیابی اطلاعات حوزه اسلام

هدف: هدف پژوهش حاضر تعیین رتبۀ کیفیِ محتوای صفحات وب بازیابی‌شده از موتورهای کاوش فارسی و غیرفارسی در حوزه اسلام است. روش‌شناسی: این پژوهش از نظر هدف کاربردی است و به روش پیمایشی‌ _ توصیفی انجام شده است. ابزار گردآوری داده‌ها، سیاهۀ ارزیابی محقق‌ساخته با چهار معیار و متشکل از گویه‌های عمومی و تخصصی است. روایی ابزار با نظر ...

متن کامل

تحلیل مقوله‌های نسبیت زبانی در عربی نسبت به فارسی و تأثیر آن بر ترجمه

در رابطة زبان و تفکر، هنوز هم سخن از فرضیة نسبیت زبانی می‌تواند بحث‌برانگیز باشد. این فرضیه که بیشتر به نام ادوارد ساپیر و لی وورف شناخته می‌شود، بر کیفیت تأثیر زبان بر تفکر استوار است. در نوع افراطی آن، این «زبان» است که تعیین‌کننده و جهت‌دهندة اندیشه است و در نوع خفیف آن، زبان در بخش‌هایی از تفکر اثر می‌گذارد. مبنای فرضیه این است که گویشوران هر زبان از دریچة زبان خود با جهان مواجه می‌شوند و آ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023